我们研究目标不当,这是强化学习(RL)中分布的概括失败。当RL代理商保留其功能过失但追求错误的目标时,就会发生目标失败失败。例如,代理商可能会继续有能力避免障碍,但要导航到错误的地方。相比之下,以前的工作通常集中在能力概括性失败上,因为代理在测试时间无法做任何明智的事情。我们将能力和目标泛化之间的这种区别形式化,提供了目标不当的第一个经验证明,并呈现了其原因的部分特征。
translated by 谷歌翻译
在DNA序列中定位启动子区域对于生物信息学领域至关重要。这是文学中广泛研究的问题,但尚未完全解决。一些研究人员使用卷积网络提出了显着的结果,允许自动提取来自DNA链的特征。然而,尚未实现可能概括为若干生物的普遍架构,从而要求研究人员寻求新的架构和对每个新的生物体的近似数目。在这项工作中,我们提出了一种基于胶囊网络的多功能架构,可以精确地识别来自七种不同生物,真核和原核的原始DNA数据中的启动子序列。我们的模型是Capsprom,可以帮助在生物之间的学习转移并扩大其适用性。此外,CAPSPROM显示出具有竞争力的结果,克服了七个测试数据集中的五分之一的基线方法(F1分数)。模型和源代码在https://github.com/lauromoraes/capsnet-promoter提供。
translated by 谷歌翻译